Age over 90 years
Maps
Spatial prediction
Unterschiede Sprachregionen
Es gibt einen signifikanten Unterschied zwischen den Sprachregionen der Schweiz und dem Anteil Ü90 Jähriger.
- Poisson Regression
- Da die Anzahl der Ü90 in 3 Datensätze unterschiedlich sind, habe ich die Regression auch noch für den UniGe Datensatz durchgeführt (dort weiss ich die Sprachregionen).
- Im Datensatz “AgeDistribution” habe ich nur die Altersverteilung der gesamten Schweiz, aber nicht nach Sprachregionen.
- Die Anzahl der Ü90 im AgeDistrubtion file erscheint mir verglichen zu dem “Original” Datensatz und dem UniGe Datensatz ein wenig zu hoch.
- Die Gesamtbevölkerung erscheint mir wiederrum im UniGe Datensatz zu niedrig
- Für die Berechnung des “Original” Datensatzes habe ich die beoachteten Werte aus dem Datensatz genommen und die Bevölkerung nach Sprachregionen aus dem Datensatz “Population_district_1860_2008.xlsx” (Ich weiss nicht, wo der herkommt. Habe ihn für mein UniGe Projekt benutzt)
- Für die UniGe Daten von 1888, sind alle Daten aus der Volkszählung
Tabelle
| Year | Language | Number_Alessia | Pop | Pop_total | Perc | Observed | Expected | Number_UniGe | Pop_UniGe_t | Pop_UniGe | Perc_UniGe | Observed_UniGe | Expected_UniGe | Pop_AgeDist | Number_AgeDist |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1888 | French | 493 | 779641 | 2917754 | 26.720587 | 160 | 131.73249 | 495 | 2783351 | 657626 | 23.627132 | 172 | 116.9543 | 2922897 | 603 |
| 1888 | German | 493 | 2011362 | 2917754 | 68.935284 | 295 | 339.85095 | 495 | 2783351 | 1998974 | 71.818969 | 283 | 355.5039 | 2922897 | 603 |
| 1888 | Italian | 493 | 126751 | 2917754 | 4.344129 | 38 | 21.41656 | 495 | 2783351 | 126751 | 4.553899 | 40 | 22.5418 | 2922897 | 603 |
| 1900 | French | 563 | 886631 | 3315443 | 26.742459 | 155 | 150.56005 | NA | NA | NA | NA | NA | NA | 3318985 | 662 |
| 1900 | German | 563 | 2290174 | 3315443 | 69.075958 | 360 | 388.89764 | NA | NA | NA | NA | NA | NA | 3318985 | 662 |
| 1900 | Italian | 563 | 138638 | 3315443 | 4.181583 | 48 | 23.54231 | NA | NA | NA | NA | NA | NA | 3318985 | 662 |
Original - 1888
Der Französische Teil und der Italienische Teil haben signifikant mehr Ü90 Jährige als der Deutschsprachige Teil
##
## Call:
## glm(formula = Observed ~ Language, family = "poisson", data = data.model,
## offset = log(Pop))
##
## Deviance Residuals:
## [1] 0 0 0
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -8.82735 0.05822 -151.615 < 2e-16 ***
## LanguageFrench 0.33593 0.09818 3.422 0.000623 ***
## LanguageItalian 0.71495 0.17235 4.148 3.35e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 2.2284e+01 on 2 degrees of freedom
## Residual deviance: 1.5543e-15 on 0 degrees of freedom
## AIC: 25.919
##
## Number of Fisher Scoring iterations: 2
UniGe - 1888
Das Ergebnis von den “Original” Daten kann mit den UniGe Daten bestätigt werden. Der Französische Teil und der Italienische Teil haben signifikant mehr Ü90 Jährige als der Deutschsprachige Teil
##
## Call:
## glm(formula = Observed_UniGe ~ Language, family = "poisson",
## data = data.model, offset = log(Pop_UniGe))
##
## Deviance Residuals:
## [1] 0 0 0
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -8.86270 0.05944 -149.094 < 2e-16 ***
## LanguageFrench 0.61380 0.09668 6.349 2.17e-10 ***
## LanguageItalian 0.80160 0.16892 4.745 2.08e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 4.9467e+01 on 2 degrees of freedom
## Residual deviance: -7.1054e-15 on 0 degrees of freedom
## AIC: 26.001
##
## Number of Fisher Scoring iterations: 2
Original - 1900
1900 leben nur noch im italienische Teil signifikant mehr Ü90 Jährige als im Deutschsprachige Teil.
##
## Call:
## glm(formula = Observed ~ Language, family = "poisson", data = data.model,
## offset = log(Pop))
##
## Deviance Residuals:
## [1] 0 0 0
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -8.75803 0.05270 -166.172 < 2e-16 ***
## LanguageFrench 0.10628 0.09607 1.106 0.269
## LanguageItalian 0.78961 0.15366 5.139 2.77e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 2.1807e+01 on 2 degrees of freedom
## Residual deviance: 4.5519e-14 on 0 degrees of freedom
## AIC: 26.319
##
## Number of Fisher Scoring iterations: 2
Unterschiede Erhebungsjahr
Zwischen den Jahren 1888 und 1900 gibt es keinen signifikanten Unterschied zwischen der Anzahl der Ü90 Jährigen.
##
## Call:
## glm(formula = Number_Alessia ~ Year, family = "poisson", data = data.model,
## offset = log(Pop_total))
##
## Deviance Residuals:
## [1] 0 0
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -8.685816 0.045038 -192.856 <2e-16 ***
## Year1900 0.004993 0.061681 0.081 0.935
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 6.5542e-03 on 1 degrees of freedom
## Residual deviance: -9.8588e-14 on 0 degrees of freedom
## AIC: 20.21
##
## Number of Fisher Scoring iterations: 2
Unterschiede Höhe Wohnort
Tabelle
| Year | Altitude | Observed | Expected | Population | Pop_total | Number | Perc |
|---|---|---|---|---|---|---|---|
| 1888 | < 400 | 86 | 71.31530 | 422070 | 2917754 | 493 | 14.465579 |
| 1888 | 400-599 | 224 | 266.68378 | 1578332 | 2917754 | 493 | 54.094074 |
| 1888 | 600-999 | 148 | 129.85934 | 768555 | 2917754 | 493 | 26.340637 |
| 1888 | > 1000 | 35 | 25.14157 | 148797 | 2917754 | 493 | 5.099710 |
| 1900 | < 400 | 97 | 89.03857 | 524338 | 3315443 | 563 | 15.815021 |
| 1900 | 400-599 | 277 | 310.24389 | 1826991 | 3315443 | 563 | 55.105487 |
| 1900 | 600-999 | 134 | 136.82536 | 805749 | 3315443 | 563 | 24.302906 |
| 1900 | > 1000 | 55 | 26.89218 | 158365 | 3315443 | 563 | 4.776586 |
1888
Es leben auf allen Höhen mehr Ü90 Jährige verglichen zu den Wohnorten auf 400-599m.
##
## Call:
## glm(formula = Observed ~ Altitude, family = "poisson", data = data.model,
## offset = log(Population))
##
## Deviance Residuals:
## [1] 0 0 0 0
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -8.86023 0.06682 -132.608 < 2e-16 ***
## Altitude< 400 0.36165 0.12685 2.851 0.00436 **
## Altitude600-999 0.30518 0.10593 2.881 0.00396 **
## Altitude> 1000 0.50524 0.18176 2.780 0.00544 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 1.5928e+01 on 3 degrees of freedom
## Residual deviance: -2.3537e-14 on 0 degrees of freedom
## AIC: 33.779
##
## Number of Fisher Scoring iterations: 2
1900
Es leben in den Wohnorten auf Höhe > 1000m signifikant mehr Ü90 Jährige verglichen zu den Wohnorten in der Höhe 400-599m.
##
## Call:
## glm(formula = Observed ~ Altitude, family = "poisson", data = data.model,
## offset = log(Population))
##
## Deviance Residuals:
## [1] 0 0 0 0
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -8.79416 0.06008 -146.364 < 2e-16 ***
## Altitude< 400 0.19898 0.11798 1.687 0.0917 .
## Altitude600-999 0.09248 0.10523 0.879 0.3795
## Altitude> 1000 0.82884 0.14762 5.615 1.97e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 2.6936e+01 on 3 degrees of freedom
## Residual deviance: 1.7764e-15 on 0 degrees of freedom
## AIC: 34.462
##
## Number of Fisher Scoring iterations: 2
Regression Alter
- Nur Daten mit einem Sterbealter
- Alle Modelle sind immer nach Erhebungsjahr kontrolliert
Nur das Jahr: Zwischen 1888 und 1900 gibt es keinen sigifikanten Unterschied im Sterbealter
##
## Call:
## lm(formula = Age ~ Year, data = data_age)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.1517 -1.1517 -0.1517 1.1010 8.8483
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 53.14749 20.91116 2.542 0.0112 *
## Year 0.02105 0.01104 1.908 0.0568 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.997 on 915 degrees of freedom
## Multiple R-squared: 0.003961, Adjusted R-squared: 0.002873
## F-statistic: 3.639 on 1 and 915 DF, p-value: 0.05676
Sprachregionen: Es gibt keine signifikanten Unterschiede zwischen Sterbealter und den Sprachregionen
##
## Call:
## lm(formula = Age ~ Language + Year, data = data_age)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.2753 -1.2753 -0.0894 1.1705 8.7247
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 52.11231 20.93084 2.490 0.0130 *
## LanguageGerman -0.18586 0.14775 -1.258 0.2087
## LanguageItalian -0.05078 0.26082 -0.195 0.8457
## Year 0.02166 0.01105 1.961 0.0502 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.997 on 913 degrees of freedom
## Multiple R-squared: 0.005792, Adjusted R-squared: 0.002525
## F-statistic: 1.773 on 3 and 913 DF, p-value: 0.1507
Wohnhöhe: Es gibt keine signifikanten Unterschiede zwischen Sterbealter und der Wohnhöhe
##
## Call:
## lm(formula = Age ~ W_Hoehe + Year, data = data_age)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.6056 -1.4332 -0.1043 1.1096 8.8179
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.250e+01 2.089e+01 2.513 0.0121 *
## W_Hoehe 4.368e-04 2.419e-04 1.806 0.0713 .
## Year 2.126e-02 1.102e-02 1.928 0.0541 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.994 on 914 degrees of freedom
## Multiple R-squared: 0.007502, Adjusted R-squared: 0.00533
## F-statistic: 3.454 on 2 and 914 DF, p-value: 0.03202
Wohnhöhe Kategorial: Es gibt keine signifikanten Unterschiede zwischen Sterbealter und der Wohnhöhe
##
## Call:
## lm(formula = Age ~ W_Hoehe_cat + Year, data = data_age)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.2924 -1.2924 -0.0826 1.1791 8.7076
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 51.64153 20.91993 2.469 0.0137 *
## W_Hoehe_cat(600,2.2e+03] 0.20980 0.13838 1.516 0.1298
## Year 0.02181 0.01104 1.975 0.0485 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.995 on 914 degrees of freedom
## Multiple R-squared: 0.00646, Adjusted R-squared: 0.004286
## F-statistic: 2.971 on 2 and 914 DF, p-value: 0.05173
Interaktion Wohnhöhe + Sprachregion: Es gibt keine signifikanten Interaktionen zwischen Sterbealter, Wohnhöhe und Sprachregion
##
## Call:
## lm(formula = Age ~ W_Hoehe * Language + Year, data = data_age)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.4208 -1.5265 -0.1043 1.0985 8.7006
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 51.9658979 20.9342864 2.482 0.0132 *
## W_Hoehe 0.0006583 0.0004422 1.489 0.1369
## LanguageGerman 0.0131765 0.3728580 0.035 0.9718
## LanguageItalian 0.2589132 0.5052885 0.512 0.6085
## Year 0.0215237 0.0110545 1.947 0.0518 .
## W_Hoehe:LanguageGerman -0.0002918 0.0005584 -0.523 0.6014
## W_Hoehe:LanguageItalian -0.0004840 0.0007105 -0.681 0.4959
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.997 on 910 degrees of freedom
## Multiple R-squared: 0.009572, Adjusted R-squared: 0.003041
## F-statistic: 1.466 on 6 and 910 DF, p-value: 0.1869